让AI学习效率飙升50倍的秘密:在线策略蒸馏
于是你换了种方法。让他自己写,然后你在旁边指出每一个句子的优劣、逻辑是否通顺、语气是否合适。
学习 策略 th thinkingmachines rlhf 2025-10-29 12:12 7
于是你换了种方法。让他自己写,然后你在旁边指出每一个句子的优劣、逻辑是否通顺、语气是否合适。
学习 策略 th thinkingmachines rlhf 2025-10-29 12:12 7
一个月前,我们曾报道过清华姚班校友、普林斯顿教授陈丹琦似乎加入 Thinking Machines Lab的消息。有些爆料认为她在休假一年后,会离开普林斯顿,全职加入 Thinking Machines Lab。
导读易彤老师是中国电信人工智能研究院算语义算法工程师。她深度参与了 telechat 大模型通用 Chat 能力的研发,以及后训练的一些优化的工作。本次演讲介绍如何去提升 LLM 基础的 Function Call 能力,系统性的阐述从数据维度及训练维度两个方
前两年,大模型火得不讲道理。从GPT-3到GPT-4,参数越堆越多,新闻也越看越玄,但真到产品经理这里,问题从来不是“这模型厉不厉害”,而是“我怎么用它干点实事”。
这几年,AI大模型的崛起几乎成了科技圈的年度大戏。它们像是一块块潜力无穷的“原石”,在不断被打磨,逐渐从“通用大脑”走向更加精细、实用的工具。而作为产品经理,如果光是知道模型算力堆得多高、参数多大,仍然会觉得“我有点跟不上节奏”。真正关键的问题是:我们如何利用